不同存储方式对应大数据哪些特征
不同存储方式对应大数据以下特征:
分布式文件系统:分布式文件系统是由多个网络节点组成的向上层应用提供统一的文件服务的文件系统。分布式文件系统中的每个节点可以分布在不同的地点,通过网络进行节点间的通信和数据传输。分布式文件系统中的文件在物理上可能被分散存储在不同的节点上,但在逻辑上仍然是一个完整的文件。使用分布式文件系统时,无须关心数据存储在哪个节点上,只需像本地文件系统一样管理和存储文件系统的数据。
列式存储:列式存储将数据按行排序、按列存储,将相同字段的数据作为一个列族来聚合存储。当只查询少数列族数据时,列式数据库可以减少读取数据量以及数据装载和读入读出的时间,提高数据处理效率。按列存储还可以承载更大的数据量,获得高效的垂直数据压缩能力,降低数据存储开销。
键值存储:键值存储,即Key-Value存储,简称KV存储,是NoSQL存储的一种方式。它将数据按照键值对的形式进行组织、索引和存储。KV 存储非常适合不涉及过多数据关系和业务关系的业务数据,同时能有效减少读写磁盘的次数,比结构化查询语言数据库存储有更好的读写性能。键值存储一般不提供事务处理机制。
图形数据库:图形数据库主要用于存储事物及事物之间的相关关系,这些事物整体上呈现复杂的网络关系,可以简单地称之为图形数据。使用传统的关系数据库技术已经无法很好地满足超大量图形数据的存储、查询等需求,比如上百万或上千万个节点的图形关系,而图形数据库通过采用不同的技术可以很好地解决图形数据的查询、遍历、求最短路径等需求。在图形数据库领域,有不同的图模型来映射这些网络关系,比如超图模型,以及包含节点、关系及属性信息的属性图模型等。
关系数据库:关系模型是最传统的数据存储模型,使用记录(由元组组成)按行进行存储,记录存储在表中,表由架构界定。表中的每列都有名称和类型,所有记录都要符合表的定义。SQL是专门的查询语言,可提供相应的语法查找符合条件的记录,如表联接。表联接可以基于表之间的关系在多表之间查询记录。表中的记录可以被创建和删除,记录中的字段也可以单独更新。
文档存储:文档存储支持对结构化数据的访问,不同于关系模型的是,文档存储没有强制的架构要求。事实上,文档存储以封包键值对的方式进行存储。在这种情况下,应用会对要检索的封包采取一些约定,或者利用存储引擎的能力将不同的文档划分成不同的集合,以管理数据。
基于内存存储的内存数据库:内存存储是指内存数据库将数据库的工作版本放在内存中,由于数据库的操作都在内存中进行,因而磁盘 I/O 不再是性能瓶颈,内存数据库系统的设计目标是提高数据库的效率和存储空间的利用率。内存存储的核心是内存存储管理模块,其管理策略的优劣直接关系到内存数据库系统的性能。